# -*- coding: utf-8 -*-
"""
@Time    : 2025/2/26 19:02 
@Author  : ZhangShenao 
@File    : 7.命名实体识别.py 
@Desc    : 命名实体识别

命名实体识别是识别文本中具有特定意义的实体,如人名、地点、组织、日期、时间、货币数额等
旨在识别出文本中的实体,并将它们归类为预定义的类别
"""

import spacy

# 加载英文模型
nlp = spacy.load("en_core_web_sm")
# 示例文本
text = "Apple is looking at buying U.K. startup for $1 billion."
# 处理文本
doc = nlp(text)
# 词性标注
print("POS Tagging:")
for token in doc:
    print((token.text, token.pos_))
# 命名实体识别
print("\nNamed Entity Recognition:")
for ent in doc.ents:
    print((ent.text, ent.label_))
